یادگیری پایان به مرحله از تولید ژست همزمان گفتار برای روبات های
محققان پژوهشکده الکترونیک و ارتباطات از راه دور (ETRI) در کره جنوبی اخیراً یک مدل شبکه عصبی تهیه کرده اند که می تواند توالی حرکات گفتاری را ایجاد کند. مدل آنها که در 52 ساعت مذاکرات TED آموزش دیده بود ، حرکات شبیه به انسان را تولید کرد که با گفتار متناسب بود.
"دستگاه های هوشمند که با آنها ارتباط برقرار می کنیم از رایانه های شخصی گرفته تا تلفن های همراه و بلندگوهای هوشمند تکامل یافته اند" ، به TechXplore گفت. "ما فکر می کنیم که روبات های اجتماعی می توانند بستر تعامل بعدی باشند. حرکت فیزیکی یکی از تفاوت های اساسی بین روبات های اجتماعی و سایر دستگاه های هوشمند است ، و باز کردن امکانات جدید برای تقلید از رفتارهای انسانی یا حیوانات ، که می تواند صمیمیت را افزایش دهد."
حرکات همزمان گفتار می تواند کیفیت تعامل بین انسان و روبات های اجتماعی را تا حد زیادی بهبود بخشد. اکثر روبات های موجود با استفاده از روش های ارتباط حرکات گفتار مبتنی بر قانون ، حرکات ایجاد می کنند. با این حال ، این تکنیک ها نیاز به تلاش های زیادی دارند ، زیرا آنها بر اساس تخصص و دانش انسانی بنا شده اند.
یون گفت: "ما می خواستیم رفتارهای طبیعی و انسانی مانند انسان به ویژه حرکات دست را هنگام صحبت ایجاد کنیم." "مشاهده دیگران روشی بسیار طبیعی برای یادگیری یک رفتار جدید است ، بنابراین ما یک مدل تولید ژست مبتنی بر یادگیری را پیشنهاد دادیم که در مجموعه داده های گفتگوهای TED آموزش داده شده است."
این مدل که توسط یون و همکارانش ابداع شد ، در یک مجموعه داده حاوی 52 ساعت فیلم ویدئویی از مذاکرات TED آموزش داده شد. پس از آموزش ، این مدل می تواند توالی حرکات شبیه به انسان و نواحی فوقانی بدن را متناسب با متن گفتار نوشتاری ایجاد کند.
یون توضیح داد: "طراحی رفتارهای اجتماعی روبات ها دشوار و وقت گیر است زیرا باید زمینه ها ، طبیعی بودن ، زیبایی شناسی حرکت ، فضای کنترل روبات ها و عوامل دیگر را در نظر بگیریم." وی ادامه داد: مطالعات جدید یادگیری پایان تا پایان ، پتانسیل هوش مصنوعی را برای ایجاد چنین رفتارهای پیچیده ای روشن کرده است .پس از دیدن برنامه های موفق در رانندگی خودمختار و تولید حرکات صورت ، تصمیم گرفتیم یادگیری پایان تا پایان را به صورت سخنرانی اعمال کنیم. تولید ژست. "
مدل شبکه عصبی توسعه یافته توسط یون و همکارانش انواع مختلفی از حرکات، از جمله یاد، استعاری، ارجاع، و حرکات ضرب و شتم موفقیت تولید می شود. علاوه بر این ، قادر به ایجاد توالیهای مداوم از حرکات برای متن های گفتاری به هر طول بود.
محققان دریافتند که این روش در ایجاد حرکاتی که شبیه به انسانهاست از روشهای پایه بهتر است. در یک ارزیابی ذهنی ، 46 نفر که در آمازون مکانیک ترک استخدام شده اند احساس کردند که حرکات ایجاد شده شبیه انسان بوده و از لحاظ محتوا از لحاظ گفتاری نزدیک است.
یون گفت: "ما دریافتیم که روبات ها می توانند مهارت های اجتماعی را یاد بگیرند." "برای تولید ژست همزمان گفتار ، مدل آموزش داده شده در مجموعه داده های بزرگ ، به اندازه کافی کلی است ، بنابراین ربات می تواند حرکات شبیه به انسان را برای هر گفتار ایجاد کند. ما فکر می کنیم این رویکرد می تواند برای سایر مهارت های اجتماعی نیز کاربرد داشته باشد. به شخصیت های بازی های ویدئویی و جهان های VR. "
مطالعه انجام شده توسط یون و همکارانش پتانسیل یادگیری پایان به مرحله را برای تولید ژست همزمان گفتار نشان داد. در آینده می توان از آن برای تقویت تعامل انسان و روبات استفاده کرد و همچنین می تواند تحقیقات مشابهی را القا کند ، زیرا مجموعه داده مذاکرات TED که از آنها استفاده می شود در دسترس عموم است. محققان اکنون قصد دارند با تولید حرکات شخصی شده برای روبات های مختلف ، یک گام به جلو مطالعه خود را انجام دهند.
یون گفت: "روبات ها ممکن است مانند افراد شخصیت خاص خود را داشته باشند." "یک روش تولید ژست شخصی می تواند اطمینان حاصل کند که روبات های مختلف با توجه به شخصیت خود ، خود را با سبک های مختلف حرکات ابراز می کنند."
http://prbookmarkingwebsites.com/story5101186/پمپ-وکیوم-آبی